A Higher-level Visual Representation for Semantic Learning in Image Databases. (Une représentation visuelle avancée pour l'apprentissage sémantique dans les bases d'images)
نویسنده
چکیده
With the availability of massive amounts of digital images in personal and on-line collections, effective techniques for navigating, indexing and searching images become more crucial. In this thesis, we rely on the image visual content as the main source of information to represent images. Starting from the bag of visual words (BOW) representation, a higher-level visual representation is learned where each image is modeled as a mixture of visual topics depicted in the image and related to high-level topics. First, we enhance the BOW representation by characterizing the spatial-color constitution of an image with a mixture of n Gaussians in the feature space. This leads to propose a novel descriptor, the Edge Context, which plays a role as a complementary descriptor in addition to the SURF descriptor. Such enhancements incorporate different image content information. Second, we introduce a new probabilistic topic model, Multilayer Semantic Significance Analysis (MSSA) model, in order to study a semantic inference of the constructed visual words. Consequently, we generate the Semantically Significant Visual Words (SSVWs). Third, we strengthen the discrimination power of SSVWs by constructing Semantically Significant Visual Phrases (SSVPs) from frequently co-occurring SSVWs that are semantically coherent. We partially bridge the intra-class visual diversity of the images by re-indexing the SSVWs and the SSVPs based on their distributional clustering. This leads to generate a Semantically Significant Invariant Visual Glossary (SSIVG) representation. Finally, we propose a new spatial weighting scheme and a Multiclass Vote-Based Classifier (MVBC) based on the proposed SSIVG representation. The large-scale extensive experimental results show that the proposed higher-level visual representation outperforms the traditional part-based image representations in retrieval, classification and object recognition. Keyword : Image Representation, Image Indexing, Bag of Visual Words (BOW), Probabilistic Topic Model , Weighting Scheme, Image classification, Image Retrieval, Object Recognition. te l-0 06 66 66 9, v er si on 1 6 Fe b 20 12
منابع مشابه
Une métrique pondérée pour la recherche textuelle d'images dans des documents semi-structurés
The birth of the XML standard and the growing use of images in electronic documents raised an open issue in information retrieval: image retrieval in semi-structured documents. This article presents a method to evaluate a semantic representation of images using the text and the document structure. More precisely, we propose a measure that evaluates the participation of each element of the docum...
متن کاملPropositions pour la recherche contextuelle d'images dans des documents XML
RÉSUMÉ. Cet article s’inscrit dans le cadre de la recherche d’images dans des documents XML. Ce type de recherche peut utiliser des informations sémantiques en plus des informations visuelles de l’image. Nous nous proposons ici d’explorer des pistes pour la recherche de ces informations sémantiques au sein des documents XML, en supposant qu’une image peut être présentée par les autres éléments ...
متن کاملTranslation of English Text to a DRS-based, Sign Language Oriented Semantic Representation
Une vue d’ensemble de l’architecture de la partie linguistique d’un système de traduction de texte Anglais en langage de signes est présentée. Nous nous concentrons sur la traduction du texte en langue naturelle vers une représentation sémantique pour l’aide à la traduction gestuelle. Nous rapportons nos progrès actuels dans l’application de techniques syntaxiques, sémantiques et contextuelles ...
متن کاملAide à l'analyse visuelle de réseaux sociaux pour la detection de comportements suspects
Résumé. Cet article traite de l’analyse visuelle de réseaux sociaux pour la détection de comportements suspects à partir de données de communications fournies à des enquêteurs suivant deux procédures : l’interception légale et la rétention de données. Nous proposons les contributions suivantes : (i) un modèle de données et un ensemble d’opérateurs pour interroger ces données dans le but d’extra...
متن کاملVers une ontologie pour les communautés de développement de logiciel libre
Résumé : Différentes approches du développement logiciel se sont succédées et cohabitent. Le développement de logiciel libre peut être vu comme un cas particulier de développement distribué ayant une structure de projet plus volatile, sans organisation clairement définie, nécessitant une participation à long terme et une vision commune des participants. La nature dynamique et libre de ce type d...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2011